iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 16
0

在我做AI的時候常常會覺得時間讓我很頭痛,不知道怎麼處理,甚至是訓練資料集跟測試資料集的時間壓根沒有重疊。

# #時間處理
 x = str_pad(fraud_train$loctm, width = 6, pad = 0)
 
 t3 = paste(('2019-01-01') %>% as.Date() + fraud_train$locdt,
            paste0(substring(x,1, 2),':', substring(x,3, 4),':', substring(x,5, 6))) %>%
            as.POSIXlt() %>% as.numeric()

對我就浪費了一點時間去檢視重疊率,既然是0那我就篩掉這個變數吧。

 t3_data_f = data.frame(names = rep("t3",length(t3)),value = t3)
 t6_data_f = data.frame(names = rep("t6",length(t6)),value = t6)
 t9_data_f = rbind(t3_data_f,t6_data_f)
 plot(t9_data_f)

https://ithelp.ithome.com.tw/upload/images/20191001/201116035BAZl6KgYZ.png


上一篇
R語言 - 寫出檔案
下一篇
R語言 - 輸出清晰的決策樹
系列文
R語言 - 從「主觀感覺」轉為「客觀事實」30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言